Для того, чтобы расшифровать страницу рукописного текста, специалисту необходимо около получаса. Нейросеть справляется с этим за несколько секунд.
В основе технологии — система оптического распознавания символов. Нейросеть обучали, используя реальные документы 18-19-го веков.
Попробовать технологию можно в действии. Сервис доступен всем желающим, он предоставляет доступ к 2,5 миллионам страниц дореволюционных документов, их количество будет увеличиваться. Среди доступной информации — метрические книги, исповедные ведомости ( в них вносили данные о прихожанах, бывших на исповеди и причастии ), данные о переписи населения. Есть фильтры по годам, архивам и фондам.
Тем временем, Google презентовал переводчик плохого почерка медиков в печатный текст. Пока эта функция доступна только на хинди, разработчики планируют добавить в него и европейские языки.